2006. 10. 『인문학과 문화콘텐츠』, 다할미디어


문화콘텐츠와 인문정보학



1. 인문정보학이란 무엇인가?


  인문정보학은 “문화와 기술을 아우르는 현대 사회의 복합적 지식 수요에 부응하는 지식 정보의 계발을 목적으로, 전통적인 인문과학 분야의 지식과 정보 기술 사이의 학제적 소통 및 응용 방법에 대해 연구하는 학문”이다. 인문학과 정보학의 긴밀한 연계를 표방하는 이 새로운 학문은 그 자체가 하나의 분과 과학으로 정립되는 것을 지향하지 않는다. 상호 이해를 필요로 하는 두 분야 사이의 가교 역할을 함으로써 인문 지식의 사회적 공유체계를 구축하고, 그 체계 안에서 훈련을 받은 인문학 전공자가 정보 전문가로서 정보화 사회에 진출할 수 있는 여건을 만드는 것이 이 학제적 활동의 목표이다.

  인문정보학은 왜 필요한가? 인문 지식과 정보 기술 사이의 의사소통이 원활하지 않았던 시절, 『조선왕조실록 CD-ROM』이라고 하는 초창기의 디지털 문화콘텐츠가 만들어지던 때의 상황은 이 질문에 대한 답을 시사한다.


  인문학자들은 자신들이 자료 정리의 구상을 하고 전산 기술자들에게 그 뒤처리를 지시하면 나머지 과정은 미리 정해진 기계적 프로세스에 따라 진행될 수 있을 것이라고 생각한다. 재미있는 것은 그 문제에 대해  컴퓨터 전문가들은 정반대의 생각을 한다는 것이다. 플렛폼을 설계하는 능력을 갖춘 자신들이 프로젝트를 주도하고, 인문학 전공자들은 보조 인력으로서 콘텐츠를 가공하는 단순 업무를 맡으면 결과물을 내놓을 수 있다는 것이다. 언뜻 보면 서로가 비슷한 이야기를 하는 것 같고, 그래서 합의점에 이르기도 쉬울 것 같지만 막상 일을 진행하려고 하면 벽두부터 의사소통의 벽에 부딪히는 것이 다반사이다. 학제간 연구 사업이 쉽지 않은 이유는 상대방 분야를 별 것 아닌 것으로 평가절하하는 데 기인하는 경우가 많다.

  1995년 10월, 서울시스템주식회사의 한국학데이터베이스 연구소에서는 16만 페이지 분량의 방대한 데이터를 담은 국역 조선왕조실록 데이터베이스를  CD-ROM 판으로 간행하였다. 조선왕조실록 데이터베이스를 개발할 때 참여한 이 연구소의 개발 조직은 인문학 전공자로 구성된 편집진과 프로그래머 그룹으로 이루어져 있었는데, 프로그래머들은 다시 데이터 편집기를 개발하는 에디터 개발 팀, 자료 인덱싱 기법을 연구하는 검색 엔진 개발 팀, 사용자가 다각적으로 자료에 접근할 수 있도록 하는 응용 프로그램 개발 팀, 실록을 위해 특별히 제작된 한자 서체가 컴퓨터 상에서 운영될 수 있도록 하는 서체 프로그램 개발 팀으로 나누어져 있었다. 편집진 역시 그 안에는 조선사를 전공으로 하는 역사 연구자 그룹이 있고, 한문 해석에 능통한 한학자 그룹이 있었다. 그 한 사람 한 사람에게는 자신이 맡고 있는 분야가 소중하다. 자기 분야의 일에 보다 많은 시간과 인력이 투여되어지기를 바라고, 다른 분야의 일들이 자기 업무 중심으로 맞춰지기를 요구한다. 사실상 개발 업무가 진행되는 동안 우리는 분야별 업무들이 사소한 것부터 굵직한 것까지 끊임없이 상충하는 것을 경험했다. 예컨대 데이터베이스 구축 도중 초기에 설계된 프로그램 구조로는 도저히 수용할 수 없는 예외적인 형태의 원시 자료를 만나게 된 경우 자료의 원형을 중요시하여 프로그램을 바꿀 것이냐 프로그램에 맞춰 자료의 구조를 다른 형태로 바꿔서 처리할 것이냐를 가지고 편집진과 프로그래머의 의견이 맞부딪치게 된다. 이러한 문제들은 모두 개발진들을 참여시킨 회의에서 최종 방침이 결정된다. 그러나 이 회의라고 하는 것은 결코 민주적인 회의가 아니다. 그들은 발견된 문제를 제기할 뿐 어느 누구도 답안을 제시하지 못한다. 모든 문제는 상이한 분야에서 발생한 원인들이 서로 얽혀 있는데 상대방의 일에 대해서는 무엇을 존중하고, 무엇을 버리도록 요구할지 알지를 못하기 때문이다. 《「한국학과 뉴미디어의 접목을 위한 거대한 실험」, 『2001년의 한국, 59인의 초상』》


  『조선왕조실록』정보화의 목적은 조선시대에 역사에 대한 지식을 소수의 전공자뿐 아니라, 가깝게는 인접 학문의 종사자에서부터 더 넓게는 작가, 언론인, 일반인까지 우리의 역사에 대한 지식 수요자들에게 폭넓게 제공하자는 데 있었다. 그러한 지식 공유의 기반을 조성하는 일은 인문계 연구자들의 연구 활동과 동떨어진 별개의 일이 아니라 연구 업무의 중요한 한 부분이다. 그러나 우리나라 역사 연구자의 경우 지식 정보의 편찬에 대한 전문 지식을 보유한 사람이 극소하다는 사실이 그러한 과업의 수행을 용이치 않게 하였다. 『조선왕조실록』처럼 사회적 관심이 모아진 콘텐츠에 대해서는 막대한 예산을 들여 고급 정보 기술력을 집중적으로 투입하는 것이 가능했기에 인문 분야 연구자들이 결여한 전자 정보 편찬 능력을 부분적으로나마 보완할 수 있었지만, 그러한 여건이 갖추어지지 않은 채 진행된 문화콘텐츠 개발 사업의 성과물들은 소기의 목적을 완수하기 어려운 형태에 머물고 있는 경우가 적지 않다.

  혹자는 인문계 연구자들은 인문 분야의 지식 생산에만 전념하면 되고, 그 외의  일은 정보 기술 전문가들이 알아서 해 줄 수 있을 것으로 기대하지만, 그것은 사실 불가능한 일이다. 인문학자들 대신해서 인문 지식을 정보화 해 줄 수 있는 정보전문가는 존재하지 않는다. 전문적인 분과 과학으로서의 정보과학이나 컴퓨터 공학은 그 분야 종사자들의 관심과 논리 또는 시의성을 좋아 매우 협소한 주제를 탐구할 뿐이다. 순수 인문학이 정보과학 같은 것에 관심을 두지 않는 것과 똑 같은 수준으로, 정보과학의 주류는 인문과학의 시급한 문제에 대해 무관심하다. 정보 기술이 인문계 연구자들에게 생소한 것 이상으로 인문 지식이 정보 기술 전문가들에게는 난해하게 보인다는 점도 이해해야 한다. 역사학자들에게 XML 마크업 기호가 낯선 외국어처럼 보이겠지만, 전산 전문가에게는 역사 기록에 쓰인 한문 문장들이 해독 불가능한 암호로 보일 뿐이다.

  지식 정보화의 과제는 해당 분야의 지식 전문가들이 직접 활용 가능한 정보 기술을 도입하고 정보 편찬 업무에 참여함으로써 수행될 수 있다. 정보 기술의 도입 경험이 없는 초기에는 물론 기술 분야 전문가의 지도가 절대적으로 필요하다. 그러나 그것은 어디까지나 한시적인 학습 과정으로서만 유효할 뿐이다. 정보 기술의 활용 능력 토대로 한 지식 정보의 생산은 어디까지나 그 연구 활동 당사자의 몫이다. 그것을 ‘인문정보학’이라고 하든, 아니면 다른 어떠한 이름으로 명명하든, 인문 지식의 종사자가 중심이 되어 수행하는 인문학과 정보학의 긴밀한 학제적 연계가 필요한 이유가 여기에 있다.



2. 문화콘텐츠와 인문정보학


  인문정보학에 대한 이해와 교육의 필요성이 강도 높게 제기되는 이유 중의 하나는 최근 들어 우리 사회에서 “문화콘텐츠”의 제작과 유통에 대한 관심이 증폭되고 있기 때문이다. 문화콘텐츠와 인문정보학은 어떠한 관계를 맺는가? 우리가 문화콘텐츠라고 부르는 것의 함의를 먼저 살펴 볼 필요가 있다.

  근년의 한국 사회에서 ‘콘텐츠(Contents)’로 명명되는 대상은 영화, 음악, 애니매이션, 게임, 케릭터, 그밖의 각종 정보 자료나 도서 저작물 등 사람들이 보고, 듣고, 읽는 모든 자원들이 그에 해당하는 것으로 보여진다.  인간들이 지적 정서적으로 향유하는 모든 종류의 무형 자산을 포괄적으로 지목하는 이름이 ‘문화콘텐츠’인 것이다. 그 같은 지식․문화 자원들은 사실상 예전부터 존재해 왔던 것들인데, 오늘날에 와서 ‘콘텐츠’라는 이름으로 지목하게 된 이유는 무엇인가? 그것은 디지털 정보 기술에 의한 미디어의 혁신을 떼 놓고는 생각할 수 없는 일이다.

  원래 콘텐트(Content)라고 하는 말은  미디어(Media) 또는 플렛폼(Platform)에 담기는 ‘내용물’의 의미로서 매체와 결합하여 지식 정보 유통의 전체적인 체계를 이루는 것이다. 따라서 이 말은 그 자체로 독립적인 의미를 갖는 개념이기보다 정보 유통 체계의 한 요소를 지칭하는 것이라고 보아야 한다.  우리가 사용하는 ‘콘텐츠’라는 용어의 개념은 그 외연이 아무리 확대되었다고 해도 본질적으로 '정보 시스템' (Information Systems)이라고 하는 플렛폼을 매개로 하여 유통되는 내용물을 의미한다. 그리고 그 내용물의 소재나 용처가 '문화적'인 경우, 그것을 문화콘텐츠라고 부르는 것이다.

  문화콘텐츠의 의미를 이렇게 이해하게 보면, 디지털 정보를 다루는 기술이 양질의 문화콘텐츠를 제작하기 위한 관건이 됨을 부인할 수 없게 된다. 그림을 그릴 때 아무리 좋은 소재가 있어도, 양질의 화구와 그것을 자유롭게 다룰 수 있는 능력이 따라 주지 않으면 좋은 그림이 나올 수 없듯이, 문화콘텐츠의 제작은 소재와 아이디어만으로 이루어지는 것이 아니라, 그것을 디지털 문화 자원으로 형상화 할 수 있는 기술적 지반이 뒷받침되어야 하는 것이다. 문화콘텐츠의 입장에서 보는 인문정보학의 의미는 그 소재와 무형의 아이디어를 디지털 저작물로 형상화 하는 방법을 정립하는 것이라고 할 수 있다.

  문화콘텐츠를 제작하는 데 요구되는 기술적 능력이 일반적인 정보 기술과 다른 것인가? 콘텐츠와 프레임웍을 엄격하게 구분하는 입장에서 후자만을 지목하자면, 그것은 인문학보다는 공학에 가까운 의미의 정보 기술(Information Technology)에 해당한다고 할 수 있다. 그러나 우리가 굳이 '인문정보학'을 요청하는 이유는 문화콘텐츠의 세계에서는 콘텐츠와 프레임웍 각각의 독립적인 영역보다 양자가 융합하는 상호 의존적 관계성이 더 중요하기 때문이다.

  제작 초기부터 인터넷과 같은 온라인 환경에서 서비스할 것을 목적으로  하는 디지털 백과사전의 편찬 사례를 보기로 하자. 종이 책을 매체로 하는 전통적인 형태의 백과사전을 집필할 때와 온라인 환경에서 서비스할 디지털 콘텐츠를 만드는 과정이 전적으로 동일할까?  뚜렷한 차별성을 보이는 시청각 데이터의 제작은 차치하더라도, 얼핏 유사한 형태일 것으로 생각되는 텍스트의 집필 과정에서도 양자의 차이는 크다고 할 수 있다.

  종이 책 형태의 백과사전에서 하나의 항목 기사는 그 자체로 내용적 완결성을 가져야 한다. 표제어와 관련된 지식은 웬만큼 자세한 수준까지 그 항목 속에 담겨 있어야 하는 것이다. 그러나 온라인 화면상에서 마우스 버튼의 클릭만으로 유관한 정보로의 자유로운 이동이 가능한 온라인 백과사전에서는 개개의 항목 기사가 핵심적인 내용만을 담도록 하고, 관련 지식은 그것과 연결된 유관 항목 속에서 찾도록 하는 것이 바람직하다. 문서의 중요한 키워드마다 관련이 있는 다른 문서로의 연결고리를 갖도록 함으로써 내용적 관련성을 가지고 있는 모든 문서들이 하나의 문서인 것처럼 보일 수 있게 하는 것을 ‘하이퍼텍스트’(Hypertext)라고 한다. 온라인 백과사전을 제작할 때에는 콘텐츠의 기획 단계에서부터 하이퍼텍스트 응용 기술을 도입되어야 한다. 전통적인 방법으로 집필을 완료한 후, 서비스 단계에서 정보 기술을 도입하는 것이 아니라는 이야기이다.

  위에서 언급한 백과사전 콘텐츠의 예시에서, 원고 집필을 인문학의 영역으로, 온라인 서비스 구현 기술을 정보 기술의 영역으로 본다면, 양자가 구분되지 않는 영역, 즉 하이퍼텍스트의 기술 기반 위에서 이루어지는 새로운 형태의 백과사전 편찬이 바로 인문정보학의 영역이라고 이해할 수 있을 것이다.



3. 문화콘텐츠를 위한 인문정보학적 과제


  인문정보학이 대상으로 삼는 과제들은 무엇인가? 크게 보아, 인문 지식의 정보화에 관련된 모든 문제들이 인문정보학의 탐구 주제가 된다고 할 수 있다. 정보 처리 기술 수준으로 이야기하자면, 가장 낮은 단계의 데이터 입출력 문제에서부터 정보과학의 궁극적 목표라고 할 수 있는 인공지능의 구현에 이르기까지, 거기에 인문 지식이 결부되는 과제들은 모두 인문정보학의 과제일 수 있다. 그 가운데 문화콘텐츠의 제작과 직결된 것을 우선적으로 꼽는다면 ‘전자문서 편찬 기술’과 ‘하이퍼미디어 구현 방법론’을 들 수 있을 것이다.


1) 전자문서 편찬 기술과 문화콘텐츠


  전자문서의 편찬은 데이터 속의 정보 요소를 컴퓨터가 식별할 수 있도록 하는 노력이다.  우리가 전자문서 편찬에 관심을 갖는 이유는 컴퓨터가 인간이 만든 데이터에서 더 많은 정보를 얻어낼수록 인간에게 더욱 유용한 부가가치를 제공할 수 있을 것으로 기대하기 때문이다.

  다음과 같은 문장을 컴퓨터 입력했을 경우, 우리는 어떠한 활용 효과를 기대할 수 있을까?


송시열(宋時烈)은 화양동을 근거지로 생활하면서 청주 지역의 사림인 홍석기(洪錫箕) 유희령(柳希齡) 등과 교류를 하였으며, 목은(牧隱) 이색(李穡)의 「신도비음기(神道碑陰記)」, 강수(江叟) 박훈(朴薰)의 「유정서원춘추향축문(有定書院春秋享祝文)」, 규암(圭菴) 송인수(宋麟壽)의 「신도비음기(神道碑陰記)」, 천곡(泉谷) 송상현(宋象賢)의 「신도비명(神道碑銘)」등을 짓기도 하였다. 또한 청원군 가덕에 있는 덕천사우(德川祠宇)도 그와 송준길(宋浚吉)의 유지에 따라 건립된 것이다.  《「송시열」,『디지털청주문화대전』》


  이러한 글을 담은 디지털 데이터가 단순히 컴퓨터 시스템 상의 파일로만 존재한다면, 데이터 저장의 편리성 이외에 특별한 효과를 기대하기 어렵다. 그러나 그 데이터가 문자나 어휘의 검색을 가능하게 하는 정보 검색 시스템 속에 들어가면 그것의 활용성은 크게 달라진다. ‘송시열’, ‘송준길’이나 ‘화양동’, ‘덕천사우’와 같은 단어로 이 글을 찾을 수 있다. 이러한 식의 정보 검색 기능은 컴퓨터 시스템이 데이터 속의 개별 문자나 단어의 위치를 기억하는 ‘색인’(Index)을 생성했기 때문에 가능한 것이다. 이 정도의 자료 찾기의 편리성도 그것이 불가능했던 과거의 상황에 비하면 대단한 진보라고 하겠지만, 오늘날의 지식 정보 시스템이 추구하는 것은 이 정도 수준에 그치지 않는다.

  현재의 일반적인 정보 검색 시스템은 ‘송시열’이라는 문자열을 띄어쓰기 구분에 의해 하나의 단어로 인식할지언정, 그것이 사람의 이름임을 알지 못한다.  정보 검색 시스템 상에서 ‘송시열’에 대해 언급한 자료를 요구할  때, ‘송시열’ 대신 ‘우암(尤庵)’ 또는 ‘우재(尤齋)’라는 호가 쓰였거나  ‘영보(英甫)’라는 자(字) 또는 ‘송자(宋子)’라는 존칭으로 불리운 곳까지 찾아 주기는 어렵다. ‘송자대전(宋子大典)’ 이 그의 저작이라는 사실을 컴퓨터가 알 리 없기 때문에 양자를 자동적으로 연결해 주는 것도 불가능하다.  정보 검색 시스템이 이러한 문제를 해결할 정도로 지능적인 능력을 갖도록 하기 위해서는 어떻게 해야 할까? 다음의 예문을 보도록 하자.


송시열(宋時烈)<인명 유형=“성명” 식별자=“송시열|宋時烈|1607-1689”>화양동<지명 유형=”동리“ 식별자=”충북|괴산군|청천면|화양리“>을 근거지로 생활하면서 청주<지명 유형=”시군“ 식별자=”충북|청주시“> 지역의 사림인 홍석기(洪錫箕)<인명 유형="성명" 식별자="홍석기|洪錫箕|1606-1680”>, 유희령(柳希齡)<인명 유형="성명" 식별자="유희령|柳希齡|1480-1552“> 등과 교류를 하였으며, 목은(牧隱)<인명 유형="호" 식별자="이색|李穡|1328-1396”> 이색(李穡)<인명 유형="성명" 식별자="이색|李穡|1328-1396”>「신도비음기(神道碑陰記)」<서명 유형=“작품명” 식별자=“宋時烈|牧隱碑陰記”>, 강수(江叟)<인명 유형=“호” 식별자=“박훈|朴薰|1484~1540”> 박훈(朴薰)<인명 유형=“성명” 식별자=“박훈|朴薰|1484~1540”>「유정서원춘추향축문(有定書院春秋享祝文)」<서명/유형=“작품명”/식별자=“宋時烈|有定書院春秋享祝文”>, 규암(圭菴)<인명 유형=“호” 식별자=“송인수|宋麟壽|1499~1547”> 송인수(宋麟壽)<인명 유형=“성명” 식별자=“송인수|宋麟壽|1499~1547”>의 「신도비음기(神道碑陰記)」<서명 유형=“작품명” 식별자=“宋時烈|圭菴先生墓表陰記”>, 천곡(泉谷)<인명 유형=“호” 식별자=“송상현|宋象賢|1551~1592”> 송상현(宋象賢)<인명 유형=“성명” 식별자=“송상현|宋象賢|1551~1592”>「신도비명(神道碑銘)」<서명 유형=“작품명” 식별자=“宋時烈|泉谷宋公象賢神道碑銘幷序”> 등을 짓기도 하였다. 또한 청원군<지명 유형=”시군“ 식별자=”충북|청원군“> 가덕<지명 유형=”읍면“ 식별자=”충북|청원군|가덕면“>에 있는 덕천사우(德川祠宇)<지명 유형=”유적“ 식별자=”청원|덕천사우“>도 그와 송준길(宋浚吉)<인명 유형=“성명” 식별자=“송준길|宋浚吉|1606~1672”>의 유지에 따라 건립된 것이다.


  위의 예문에서는 본문 텍스트 속의 인명, 지명, 작품명 등의 키워드가 모두 그 단어의 성격을 명시적으로 드러내는 꼬리표를 달고 있다. 정보 시스템에 입력된 데이터가 이러한 식으로 정보 요소의 명시성을 강화하였을 경우 어떠한 결과를 기대할 수 있을까? 개별 키워드마다 그것의 성격과 유형이 부여되어 있으므로 성격별, 유형별 어휘 색인을 자동적으로 생산할 수 있을 것이다. 이 때 만들어지는 색인은 단어의 띄어쓰기나 구획 문자(괄호 쉼표 등)에만 의존하여 만들어지는 자동 색인과는 차원이 다른 품질을 유지할 것이며, 정확도가 높은 정보 검색 결과를 생산할 것이다.

  그 다음 기대할 수 있는 것은 꼬리표를 달고 있는 키워드를 매개로 유관한 다른 자료들을 찾아갈 수 있는 하이퍼텍스트 기능이 구현될 수 있다는 것이다. 위의 예시에서 보듯,  본문 텍스트 속의 인명은 그것이 온전한 이름으로 표기되었건, 호나 자를 사용하였건 간에 꼬리표 안에 표준화된 식별자가 있음으로써 인명사전의 관련 항목이나 그 인물에 관한 다른 자료를 정확하게 찾아갈 수 있다. 마찬가지로 본문 속의 지명은 그것의 위치를 전자화된 지도 도면상에 표시해 주는 일이 가능할 것이며, 본문 속의 작품명은 다른 데이터베이스에 수록된 그 작품의 원문을 찾아가는 연결고리 역할을 할 수 있다.

  이처럼 콘텐츠의 활용 가치를 높이기 위해 그 속의 정보 요소에 꼬리표를 붙이는 일을 마크업(Mark-up)이라고 한다. 전자문서 제작을 위한 마크업 기반 기술은 이미 세계적으로 그 표준이 확립되어 가고 있는 상황이다. XML(eXtensible Mark-up Language)1)이라고 불리우는 마크업 언어와 그 응용 기술들이 그 표준화 노력의 중심에 위치한다. XML이 만들어진 이유는 문서의 구조적인 형식과 내용 요소들이 컴퓨터가 식별할 수 있는 명시적 정보로 기술될 수 있도록 하기 위한 것이다. 그런데 XML과 같은 마크업 언어는 명시적 데이터를 만드는 도구일 뿐, 그 도구를 어떻게 사용하느냐 하는 것은 전적으로 데이터를 생산하는 사람들의 손에 달려 있다. 데이터 속에서 의미 있는 요소를 찾아내고, 요소들의 구성 체계를 정식화하며,  상호 연관성이 있는 부분 사이의 연결 고리를 만들어 주는 등의 일이 모두 그 데이터의 내용을 정확하게 이해할 수 있는 그 분야 전문가에 의해서만 이루어질 수 있는 것이다. 인문 지식의 전문가가 분석해 낸 지식이 곧바로 컴퓨터 시스템이 식별할 수 있는 정보가 되도록 하는 것이 인문정보학에서 관심을 갖는  ‘전자 문서 편찬’의 과업이다. 지식 자원으로서의 가치를 갖는 양질의 문화콘텐츠는 이와 같은 편찬 작업의 산물이라고 할 수 있다.


2) 하이퍼미디어와 문화콘텐츠


  영상이나 음향, 애니메이션 데이터의 제작, 모션 캡춰링이나 그래픽 시뮬레이션을 이용한 가상 현실의 구현 등 멀티미디어(Multimedia) 관련 기술이나 지리 정보를 전자지도 상에서 시각적인 형태로 제공하는 GIS(Geographic Information Systems) 관련 기술은 이미 문화적 소재의 디지털화에 광범위하게 응용되고 있다. 여기에서 현실 세계의 사물을 디지털 신호로 포착하고 그것을 편집하는 일은 미디어 기술 분야에서 그 소임을 충분히 하고 있으므로 거기에 별도의 인문학적 논의를 개입시킬 필요는 없다. 그러나 우리가 하고자 하는 멀티미디어 작업의 목표가 단순히 감성적인 데이터를 산출하는 데 그치지 않고, 그 속에 의미를 담아 지식 정보 자원으로서의 역할을 하게 하려는 데 있다면 인문정보학의 역할을 요청하지 않을 수 없다.

  사찰의 건축물이나 그 벽면의 탱화를 디지털 영상에 담아낼 때, 어느 각도에서 어디에 초점을 맟추어야 할지는 단지 미적 기준에 의해서만 판단할 수 있는 문제가 아니다. 그 시대 건축 양식의 특징은 어느 부문에서 발견할 수 있는지, 벽화의 그림이 전하고자 하는 메시지는 무엇이며, 그 그림의 한 부분 부분은 무엇을 형상화 하고 있는지를 파악하여, 그 의미 맥락이 디지털화된 콘텐츠 안에 담기도록 해야 할 필요가 있는 것이다.  이러한 분야의  지식이 있는 인문학도의 노력의 의해 ‘문화 자원 영상물 제작 매뉴얼’ 같은 것이 만들어졌다고 가정해 보자. 그것에 입각하여 만들어진 디지털 영상물은 지식 문화콘텐츠로서의 잠재적 가치를 지니게 되겠지만, 그 영상물의 어느 부분이 매뉴얼의 어떤 요건에 따라 만들어진 것인지를 알 수 없는 상황에서는 지식 자원으로서의 소임을 충실히 할 수가 없다. 만일 특정 주제 분야 콘텐츠의 제작 기획 단계에서부터 그 산출물의 활용 단계에 이르기까지 일관되게 적용할 수 있는 ‘멀티미디어 콘텐츠 메타데이터’2)의 형식이 정해져서 감성적 데이터 속에 담긴 의미 맥락이 명시적인 언어로 기술될 수 있다면 그것의 지식 자원적 활용 가치는 비약적으로 증대되게 된다.

  하이퍼미디어(Hypermedia)란 하이퍼텍스트와 멀티미디어가 결합한 것을 일컫는 합성어이다. 내용적 관련성을 좇는 하이퍼텍스트 연결 고리를 텍스트에 한정하지 않고 멀티미디어 데이터에까지 확장한 것이 하이퍼미디어라고 할 수 있다.  가장 단순한 형태의 하이퍼미디어는 텍스트 상의 키워드에  이미 제작된 멀티미디어 데이터 파일의 이름을 포함하는 연결 지시자를 삽입하는 것이다. 그러나 이러한 식의 하이퍼미디어 제작 기술은 변화하지 않는 콘텐츠를 만드는 데는 적합할지 모르나 윈시 데이터가 끊임없이 증가하고 변화하는 현실에 대처하는 능력은 전무한 것이다. 이에 반해 ‘멀티미디어 콘텐츠 메타 데이터’를 매개로 하여 텍스트와 멀티미디어가 연관성의 문맥을 좇아 유연하게 결합할 수 있게 한다면, 그렇게 해서 만들어진 하이퍼미디어 콘텐츠의 지식 자원적 가치가 크게 신장될 것은 물론이거니와 많은 노력이 투여되어서 만들어진 멀티미디어 데이터가 다른 콘텐츠와 관계를 맺어 재활용되는 길이 열림으로써 문화콘텐츠 제작의 생산성이 획기적으로 향상되는 것도 기대할 수 있게 된다.

  정보 기술 분야에서는 멀티미디어 데이터의 검색과 재활용, 부가가치 창출의 필요성 때문에 그것의 내용적 의미 맥락을 표준화된 주석문(Annotation) 형태로 기술하는 방법론에 대한 연구가 이미 심도 있게 진행되고 있다. 인문 지식을 토대로 만들어진 다양한 멀티미디어 콘텐츠가 일회성 소모품으로 전락하지 않고, 더욱 발전된 문화콘텐츠의 제작 기반이 되도록 하기 위해서는 이 분야의 기술 표준이 인문학적 요구와 접합되도록 하는 노력을 기울일 필요가 있다.


 

메타데이터를 매개로 한 하이퍼미디어의 구현 예

 

 

《「성화동 서낭당」,『디지털청주문화대전』》

 

상호 독립적인 향토문화 백과사전 텍스트 콘텐츠와 전자지도가  관심 지점(POI, Point of Interest)에 대한 메타데이터를 공유함으로 관련 정보 사이의 유연한 하이퍼링크를 구현한다.

 



4. 인문정보학이 추구하는 목표


  정보 기술을 배제하고는 인문 지식을 소재로 한 의미 있는 문화콘텐츠의 생산이 이루어질 수 없다는 사실이 우리로 하여금 인문 지식과 정보 기술의 융합 영역에 대해 관심을 갖게 하는 일차적인 이유이다. 그러나 인문정보학이 추구하는 궁극적인 목표는 현재 우리가 보유한 인문 지식을 디지털 매체에 그럴듯하게 담아내는 수준에 그치는 것이 아니다. 컴퓨터로 하여금 인문 지식을 이해할 수 있게 함으로써, 그것이 새로운 지식 생산의 동반자가 되도록 하자는 것이다.

  인문과학은 기본적으로 인간에 대한 관심에서 비롯된 학문이기 때문에 오늘날의 인문학자들은 그들이 학문적으로 의사소통해야 할 대상이 ‘인간’이라는 사고에 집착할지 모른다. 이들은 정보과학에서 추구하는 바가 기계로 하여금 지식을 갖게 하는 데 있다는 사실에 대해 의아해할 수 있다.  하지만 양자의  지향처는 사실 다른 게 아니다.  인간이 만든 데이터를 기계가 이해하도록 하려는 노력은 결국 지적 능력을 신장시킨 기계가 인간에게 더 많이 봉사할 수 있도록 하기 위함이기 때문이다.

  컴퓨터의 지적 능력을 높임으로써 인간 생활의 편의성을 증진시키는 사례는 현대 사회의 여러 곳에서 찾아진다. 공장 자동화, 전자 상거래, 주식 매매 프로그램, 홈 오토메이션, 자동 항법 장치..... 각각의 분야에서 활용되는 지능적인 컴퓨터 시스템은 그 분야의 업무 프로세스 및 그와 관계된 다양한 정보 자원을 데이터화 하여 저장하고 있으며, 그러한 데이터를 기반으로 그 때 그 때의 환경 변화에 적절히 대처하는 판단 능력을 발휘하도록 만들어진 것이다. 이러한 류의 지능적인 컴퓨팅 시스템은 산업 기술 분야에서만 기대할 수 있는 것이 아니다. 

  우리의 과거 기록을 담은 같은 역사 문헌 데이터베이스는 현재 특정 어휘를 포함하는 기사를 검색해 내는 정도의 역할을 수행한다. 하지만 컴퓨터가 그 특정 어휘의 문자 코드뿐 아니라 그것의 성격과 의미에 대한 정보를 가지게 된다면 우리는 그것으로부터 차원이 다른 새로운 서비스를 받게 될 것이다. 예를 들자면, 조선시대 외교사를 연구하는 사람이 『조선왕조실록』이나 『승정원일기』, 『일성록』과 같은 방대한 분량의 사료를 일일이 조사하지 않더라도, 그 속에서 외국 사람의 이름을 탐색하고 그들은 우리나라의 누구를 만났으며, 대화의 주제는 무엇이었는지를 기계적으로 요약 추출하는 것을 생각할 수 있다. 그 시대 전국 각처에 살았던 사람들의 일기, 관청에서 남긴 공문 등 고문서 자료를 수록한 데이터베이스 상에서는 여러가지 물건들의 이름과 그것의 매매 가격을 추출하여  조선시대의 경제 상황을 재구성하는 일도 가능할 것이다.

  컴퓨터가 지식 생산의 동반자 역할을 할 수 있는 지능형 정보 시스템으로 발전하기 위해서는 특정 분야의 전문 지식을 체계적으로 습득하는 학습 과정이 반드시 필요하다. 그 학습의 형태는 다른 것이 아니다. 그 분야의 정보 자료를 데이터베이스화하는 과정에서 한 권의 자료, 한 건의 기사, 하나의 문장, 한 개의 전문 어휘에 대해 일일이 그것의 성격과 유형을 알게 하는, 표준화된 양식의 부가 정보를 기입하는 방식으로 그 데이터의 내용에 대한 컴퓨터의 인지 능력을 높여 가는 것이다. 이러한 작업은 고도의 전문지식을 가진 사람들이 무한한 인내심을 가지고 데이터와의 싸움을 지속해야 하는 어려운 일임에 틀림이 없다. 하지만 지식 자원의 축적이 이루어져 감에 따라 컴퓨터의 자체적인 학습 능력도 신장되어 갈 것이기 때문에 지나치게 회의적일 필요는 없는 일이다. 중요한 것은 어느 한 사람, 어느 한 조직의 노력으로만 될 수 있는 일이 아니고, 상호 관련성이 있는 모든 지식 정보 자원에 대해 표준화된 방식의 편찬 규칙을 적용하려는 노력이 병행되어야 한다는 것이다.

  다른 장소에서 다른 사람들에 의한 만들어진 정보 콘텐츠라고 하더라도 그것들이 서로 소통하고 상호 연계하여 활용되는 것을  상호운영성(相互運營性, interoperability)3)이라고 한다. 정보 자원의 상호운영성은 데이터를 컴퓨터에 입력하는 것만으로 저절로 확보되는 것은 아니다. 일정한 지식 영역의 정보 자원이 갖는 특성을 충분히 반영한 표준적인 정보 기술 규칙이 사전에 확립되어 있어야 하고 개별 정보 자원들은 그러한 기술 규칙을 엄격하게 적용하여 생산되어야 하는 것이다.

  인문 지식 정보의 상호운영성 확보를 위해 이 분야의 연구 활동과 접목시켜야 할 해야 할 정보과학적 기술들은 어떠한 것들일까?  무엇보다 먼저 인문 분야의 지식 자원에 기계적 가독성을 부여하기 위한 마크업(Mark-up) 체계 개발 및 그 응용 기술을 들 수 있을 것이다. 이 분야의 세계적 표준으로 자리잡아 가고 있는 XML(eXtensible Mark-up Language) 관련 기술은 인문 지식뿐 아니라 모든 종류의 지식 정보 자원에 적용할 수 있는 범용적인 전자정보 편찬기술이지만, 방대한 텍스트 자료 처리의 숙제를 안고 있는 인문 지식 정보화의 입장에서 볼 때, 다른 어떠한 기술보다도 우선시해야 할 요소 기술이라고 할 수 있다. 유형화 시킬 수 있는 인문 지식 자원의 표준적인 메타 데이터(Meta Data) 형식 개발, 다양한 종류의 메타 데이터를 상호 연계 할 수 있도록 메타데이터 관련 정보의 공유 기반을 제공하는 메타데이터 레지스트리(Meta Data Registry)의 구축 기술4),  특정 영역의 전문 지식에서 쓰이는 기본 개념 및 개념들간의 관계를 명시적으로 규정하기 위한 온톨로지(Ontology)5) 관련 기술도 인문정보 전문가들에 의해 다듬어져야 할 것들이다.

  지식의 전자적 상호운영성을 확보하기 위한 기술의 형식적인 뼈대는 이미 정보과학 분야의 전문가들에 의해서 심도 있게 연구되고 있으며, 국제적인 표준화 작업까지도 이루어져 가고 있다. 하지만 이러한 정보과학적 기술 요소들을 인문 지식에 적용하여 문화콘텐츠를 생산하는 일은 어디까지나 인문 지식에 정통한 인문학도들의 주체적인 노력에 의해서만 이루어질 수 있다. 또한 그 일은 단순히 확정된 정보 기술을 인문 지식에 도입하기만 하면 되는 것이 아니라 인문 지식의 내용과 특성에 따라 적용할 기술을 변경하고 발전시키는 노력을 수반해야 하는 일이다. (김현, 한국학중앙연구원 한국학대학원 교수, 인문정보학)      



  김현은 고려대학교 철학과를 졸업하고 같은 대학 대학원에서 박사 학위를 받았다. 전자통신연구원(ETRI) 뉴미디어정보시스템연구실장, 서울시스템(주) 한국학데이터베이스 연구소장, 미국 하버드 대학 방문연구원, 한국과학기술정보연구원(KISTI) 정보시스템 부장을 역임하였고, 현재 한국학중앙연구원 인문정보학 담당 교수로 재직하고 있다. 1995년 『국역 조선왕조실록 데이터베이스 CD-ROM』간행을 비롯하여 현재의 『한국향토문화전자대전』 편찬 사업에 이르기까지 인문 지식 자원을 소재로 한 다수의 정보 시스템을 개발하였으며, 인문과학과 정보과학의 학제적 교섭을 지향하는 인문정보학의 토대를 마련하는 연구를 수행하고 있다.


1) XML(eXtensible Mark-up Language): 문서의 구조적인 형식과 내용 요소들이 컴퓨터가 식별할 수 있는 명시적 정보로 기술될 수 있도록 하기 위한 전자문서 마크업 언어이다. W3C(World Wide Web Consortium)는  1998년 최초의 권장안을 제시하였으며, 최근에 이르기까지 여러 단계의 개선안과 함께 다양한 응용 기술의 표준화 방안을 제공하고 있다.


2) 메타데이터(Metadata): 데이터의 형식, 성격, 내용 등을 알 수 있게 하는 정보를 메타데이터라고 한다. 메타데이터 관련 기술은 특정 분야 데이터에 관한 메타데이터의 형식을 표준화함으로써 데이터에 대한 정보가 기계적으로 식별될 수 있도록 하는 것을 추구한다.


3) 상호운영성(interoperability):  각기 다른 기계 장치가 동일한 조작 방식에 의해 운전될 수 있음을 말한다.  정보과학에서는 정보 자원이 상이한 정보 시스템 사이에서 서로 소통될 수 있음을 의미한다.


4) 메타데이터 레지스트리(Metadata Registry): 메타데이터의 등록과 인증을 통하여 그것의 명세와 의미를 공유하고 표준화된 메타데이터를 유지․관리하는 것을 목적으로 한다. 국제표준기구에서는 메타데이터 레지스트리’에서 데이터의 의미, 구문, 표현을 표준화할 수 있는 프레임워크를 ‘ISO/IEC 11179’로 제시하였다. 현재 여러 국가의 주요 프로젝트에서 메타데이터 레지스트리 시스템을 구현하고 있으며, 메타데이터의 등록을 통해 각 프로젝트에서 원하는 데이터의 호환성을 유지하는 방안을 모색하고 있다.


5) 온톨로지(Ontology): 정보화 대상이 되는 분야의 기본 개념과 그 개념들간의 상관 관계를 정리한 명세서. 원래는 철학에서 ‘존재에 대한 이해를 추구하는 학문’(존재론)의 의미를 갖는 말이었으나, 정보과학적 개념으로 채용된 것은 인간이 세계를 이해하는 틀과 컴퓨터가 정보화 대상(콘텐츠)을 이해하는 틀 사이에 유사성이 있다고 보았기 때문이다.